Здравствуйте. Почему "водой" система считает слова "лицо", "год", римские цифры и множество иных, несущих смысловую нагрузку? Ещё часто замечаю баг - в стоп-словах попадаются такие, коих в тексте нет и в помине. Я их не вижу, Word не находит, но прога упорно вносит в список.
Добрый день! По поводу слов, которых нет в тексте. Это связано с омоформами – словами, которые совпадают лишь в отдельных формах. Система не обладает интеллектом и способностью различать значения слов, поэтому не всегда правильно определяет форму слова.
Примеры:
Слово «белки» может быть формой мн. ч. от «белка» (животное) или «белок» (вещество). Форму «белкой» система «увидит» и укажет, что ключевое слово «белка» присутствует в тексте, а вот «белков» не «увидит» и укажет количество вхождения ключа "белок" 0.
Слово «стекло» может быть существительным «стекло» или формой глагола «стечь». Поэтому в частотном словаре статьи о стекле может появиться слово «стечь», которого нет в тексте.
Что же касается "воды" - трудно говорить конкретно, не видя текста и результата проверки. Вообще, вода - это процентное соотношение незначимых слов и стоп-слов текста к значимым и несущим смысловую нагрузку. Нормальный процент воды при проверке семантическим анализатором Адвего - в районе 60-70%. Если вы считаете, что проверка сработала некорректно, предоставьте, пожалуйста, в ЛПА https://advego.com/blog/read/feedback/ проверяемый текст.
"Почему "водой" система считает слова "лицо", "год" - вопрос не совсем понятен, уточните, вы имеете в виду что эти слова появляются в списке стоп-слов?
Потому и попало, что незначимое или малозначимое. Смысловая нагрузка слов "год", римских цифр и т. п. низкая, поскольку они могут быть заменены или даже удалены без потери смысла.
Добрый день! Подскажите, пожалуйста, как определить частоту ключевой фразы в тексте. Ключ из трех слов. По заданию "ключ должен встречаться в 5% случаев в тексте". У меня по СЕО-анализу Адвего показатель 2,07/5,02. Я выполнила условие??? Или ориентироваться надо на первую цифру????
Ориентироваться нужно на второе число, оно показывает частотность всей фразы, а первое получается путем деления второго на количество слов в фразе. Так что 2,07/5,02 у вас получиться не могло никак. Но 5,02 % - это выполненное условие тз.
И как быть с "юридическим лицом"? 1. Юридическая физиономия, зарегистрированная на территории России, обязана... 2. Юридическое, зарегистрированное на территории России, обязано...
Не "юридическая физиономия", а компания, зачем же разбивать неделимую коллокацию. И да, можно заменить не означает, что нужно, это всего лишь один из критериев оценки значимости.
Справедливости ради - в каких-то случаях "юридическое лицо" может быть и значимой коллокацией в зависимости от контекста, но текущая версия SEO-анализа не анализирует синтаксис, поэтому по умолчанию относит "лицо" к малозначимым словам.
И как быть с "юридическим лицом"? 1. Юридическая физиономия, зарегистрированная на территории России, обязана... 2. Юридическое, зарегистрированное на территории России, обязано...
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186